生物大数据分析

关于本课程的一些说明




桂松涛 Blog
songtaogui@163.com


2024年10月

WHY? 事要知其所以然

分析工具的使用也需要理解背后的原理

PCR:

  • 引物设计

  • 扩增片段大小

  • 反应循环次数

  • RT-PCR; Q-PCR ...



BLAST:

  • e-value阈值

  • 罚分矩阵

  • gap open/extension

  • 预设参数: megablast, blastx-fast ...


生信专业从业者的技能树

Bioinformatics ≈ Biology + Programming + Mathematics

新手村技能加点

  1. 基本的生物学和组学知识: 测序(二代/三代), RNA-Seq, 甲基化, ChIP-seq, ATAC-seq, 单细胞 ...

  2. 了解常用的生物数据库资源: NCBI, Ensemble, UCSC, Uniprot, CoGe, Panther ...

  3. Linux系统相关: Shell(Bash)编程, 作业调度, 超算使用 ...

  4. 掌握至少一门通用编程语言: python, perl, R, julia, rust, java, C++ ...

  5. 基本的数据分析技巧: 表格操作, 数据可视化 ...

  6. 基本的统计分析知识: 数据分布、假设检验、线性回归、聚类 ....

  7. 常见的生物信息学算法: 动态规划, 遗传算法, BWT转换, 序列比对 ...








生信工具使用者的加点建议


我以湿实验为主, 偶尔使用常规分析流程、现成的生信软件做一些基础分析, 我要学啥?

  • 基本的统计学概念和原理有一定的了解;

  • 掌握一门适合自己的统计工具Excel, R, SPSS, ...

  • 组学技术和测序建库原理有本的认识;

  • 了解常用的生信数据库和软件;

  • 善用搜索工具找到自己需要的软件, 并能看懂说明书;

  • 学会向专业人员描述问题, 快速获得帮助;


课程概览


理论基础
  • 生物大数据分析导论
  • 常用分析平台和编程语言介绍
  • 统计基础和常用方法
  • 数据可视化介绍和应用
  • 分析应用专题
  • 高通量测序和基因组分析
  • 群体遗传分析
  • 多组学整合分析
  • 数据驱动的基因功能解析

  • 绝知须躬行

    • 课上内容以框架、大纲为主;

    • 提供自学资源、资料;

    • 90%以上的内容需要课下自学掌握;

    考查方式: 文献分析方法解析